11.16 应用服务
11.16.1 Tomcat
监控目的:
监视tomcat服务器的运行状况和资源使用状况,以及运行其中的WEB服务的详细状况。监控前提:
1.必须运行名称为Manager的应用。默认情况下,该应用自动运行。(可以访问http://<host>:<port>/manager/status页面来确认Manager应用是否运行)
2.访问服务器的用户权限必须具有Manager权限。
3.如果需要配置具有"manager"权限的用户,可修改/conf 目录下的 tomcat-users.xml 文件来修改用户权限。
监视数据:
包括响应时间、服务器信息、JVM信息、线程池信息、Web应用详细信息。
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
主机地址 | 服务器的IP地址。 |
端口 | 服务器的端口,默认值为8080。 |
服务器版本 | 服务器的版本信息。 |
用户名 | 登录服务器的用户名。 |
密码 | 用户名对应的密码。 |
数据采集 | 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
ResponseTime | 响应时间 | responseTime | 响应时间(ms) |
ServerInfo | 服务器信息 | tomcatVersion | Tomcat版本 |
JVMVersion | JVM版本 | ||
JVMVendor | JVM提供者 | ||
OSName | 操作系统名字 | ||
OSVersion | 操作系统版本 | ||
OSArchitecture | 操作系统架构 | ||
JVM | JVM信息 | freeMemory | 空闲内存(MB) |
totalMemory | 总内存(MB) | ||
maxMemory | 最大内存(MB) | ||
MemoryPool | JVM内存池 | name | 内存池名 |
type | 类型 | ||
initial | 初始大小(MB) | ||
total | 总大小(MB) | ||
maxium | 最大值(MB) | ||
used | 已使用(MB) | ||
usedRatio | 使用率(%) | ||
ThreadsPool | 线程池信息 | ThreadsPoolName | 线程池名称 |
maxThread | 最大线程数 | ||
busyThread | 占用的线程数 | ||
currentThread | 当前线程数 | ||
maxSpareThread | 最大空闲线程数 | ||
totalRequest | 请求总数 | ||
errorRequest | 错误请求个数 | ||
ApplicationDetial | Web应用详细 | applicationName | 应用名称 |
startTime | 启动时间 | ||
activeSession | 活动会话个数 | ||
sessionCount | 会话个数 | ||
maxActiveSession | 最大活动会话 | ||
rejectedSessionCreations | 拒绝创建会话个数 | ||
expiredSessions | 会话超时个数 | ||
averageSessionAlivetime | 平均会话活动时间 | ||
jspLoaded | JSP加载个数 | ||
jspReloaded | JSP重载个数 |
11.16.2 Apache
监控目的:
提供对Apache服务器主要性能数据和运行状况的监视,以及其上的各WEB服务的运行详情。
监视数据:
响应时间、访问总数、字节总数、运行时间、每秒请求数、每秒传输字节数、每次请求平均传输字节数、活动子进程、空闲子进程。
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
主机地址 | 服务器的IP地址。 |
端口 | 服务器的端口,默认值为80。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
用户名 | 登录服务器的用户名。 |
用户密码 | 用户名对应的密码。 |
是否SSL | 是否启用SSL,包括:是、否 |
数据采集 | 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
apache | 性能数据 | ResponseTime | 响应时间 |
TotalAccesses | 访问总数 | ||
TotalKBytes | 字节总数 | ||
Uptime | 运行时间 | ||
ReqPerSec | 每秒请求数 | ||
BytesPerSec | 每秒传输字节数 | ||
BytesPerReq | 每次请求平均传输字节数 | ||
BusyWorkers | 活动子进程 | ||
IdleWorkers | 空闲子进程 |
11.16.3 Exchange
监控前提:
1.确保被监控端安装Exchange服务器并且服务启动,用于监控的用户具有Exchange服务器所在系统的管理员权限;
2.确保监控端和被监控端WMI服务开启并开放权限。
监控数据:
1.收发引擎:POP连接数、IMAP连接数、SMTP接入连接、SMTP接出连接、本地与远程队列等;
2.邮箱信息:空间大小、收发队列、用户登入、邮件发送与传输、收件人交付等;
3.信息存储:活跃连接数、总连接、活跃用户数;
4.MTA连接:队列大小、队列字节数、接入关联、接出关联;
5.MTA信息:工作队列大小、工作队列字节、消息传输字节/秒、TCP/IP接收与传输、排队收件人数;
6.TD 信息:本地传送数、当前从MTA接收邮件数、当前发送到MTA邮件数、邮件接收/秒、HSOT缓存命中数;
7.管理信息:事件服务队列大小、地址列表队列长度、待复制同步、剩余复制更新;
8.公共文件夹:空间大小、收发队列大小、用户登入、邮件发送与传输、收件人交付等。
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
主机地址 | Exchange服务器的IP地址。 |
端口 | 服务器的端口,默认为25。 |
用户名 | 可登录服务器的用户名。配置的用户必须具有Exchange服务器所在系统的管理员权限。 |
用户密码 | 用户名对应的密码。 |
版本 | Exchange程序的版本,包括:Exchange5.5、Exchange2000、Exchange2003、Exchange2007 |
监视数据 | 监视的数据,包括SMTP/POP(IMAP)、邮箱、公共文件夹、信息存储、MTA信息、MTA连接信息、TD信息、Exchange管理,可选择一项或多项。 |
数据采集 | 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
SMTPIMAPPOP | 邮件收发引擎 | InboundConnectionsCurrent | 当前接入连接数 |
OutboundConnectionsCurrent | 当前接出连接数 | ||
LocalRetryQueueLength | 本地重发队列大小 | ||
LocalQueueLength | 本地队列大小 | ||
RemoteRetryQueueLength | 远程重发队列大小 | ||
RemoteQueueLength | 远程队列大小 | ||
MessagesPendingRouting | 待路由邮件 | ||
CurrentMessagesinLocalDelivery | 当前本地传送邮件 | ||
MessagesCurrentlyUndeliverable | 当前不可传送邮件 | ||
CategorizerQueueLength | 分类队列长度 | ||
POPConnectionsCurrent | POP当前连接数 | ||
IMAPConnectionsCurrent | IMAP当前连接数 | ||
MAILBOX | 邮箱信息 | FileSize | 大小(MB) |
ReceiveQueueSize | 接收队列大小 | ||
SendQueueSize | 发送队列大小 | ||
ActiveClientLogons | 有效用户登入 | ||
ClientLogons | 用户登入 | ||
LogonOperationsPersec | 每秒登录操作 | ||
MessageRecipientsDeliveredPermin | 收件人交付 | ||
MessagesDeliveredPermin | 邮件传输数 | ||
MessagesSentPermin | 邮件发送数 | ||
PUBLICFOLDERS | 公共文件夹信息 | FileSize | 大小(MB) |
ReceiveQueueSize | 接收队列大小 | ||
SendQueueSize | 发送队列大小 | ||
ActiveClientLogons | 有效的用户登入 | ||
ClientLogons | 用户登入 | ||
LogonOperationsPersec | 每秒登录操作 | ||
MessageRecipientsDeliveredPermin | 收件人交付 | ||
MessagesDeliveredPermin | 邮件传输数 | ||
MessagesSentPermin | 邮件发送数 | ||
MessagesSubmittedPermin | 邮件提交数 | ||
IS | 信息存储 | ActiveConnectionCount | 活跃连接数 |
ConnectionCount | 连接总数 | ||
ActiveUserCount | 活跃用户数 | ||
MTA | MTA信息 | WorkQueueLength | 工作队列大小 |
MessageBytesPerSec | 消息传输字节/秒 | ||
TCPIPReceiveBytesPersec | TCP/IP接收/秒 | ||
TCPIPTransmitBytesPersec | TCP/IP传输/秒 | ||
TotalRecipientsQueued | 排队收件人总数 | ||
WorkQueueBytes | 工作队列字节 | ||
MTACONN | MTA连接信息 | Name | 名称 |
QueueLength | 队列大小 | ||
QueuedBytes | 队列字节数 | ||
CurrentInboundAssociations | 当前接入关联 | ||
CurrentOutboundAssociations | 当前接出关联 | ||
TD | TD信息 | LocalDelivery | 本地传送数 |
CurrentmessagefromMSExchangeMTA | 当前从MTA接收邮件数 | ||
CurrentmessagestoMSExchangeMTA | 当前发送到MTA邮件数 | ||
MessagesReceivedPersec | 邮件接收/秒 | ||
HSOTCacheHits | HSOT缓存命中数 | ||
ESALSRS | Exchange管理信息 | NotifyQueue | 事件服务队列大小 |
AddressListsQueueLength | 地址列表队列长度 | ||
PendingReplicationSynchronizations | 待复制同步 | ||
RemainingReplicationUpdates | 剩余复制更新 |
11.16.4 Tuxedo
监控目的:
通过SNMP方式监视TUXEDO服务器的使用和健康状况。
监控前提:
被监控端安装SNMP代理服务并开启该服务,同时开放监控平台对其的SNMP访问权限。
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
主机地址 | Tuxedo服务器所在主机的地址。 |
SNMP端口 | SNMP服务的端口,默认值为161。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
Community字符串 | 团体字符串,用于身份验证和访问授权。可使用默认值,如果SNMP不是指定版本,则需要重新配置。 |
SNMP协议版本 | SNMP协议的版本,包括V1、V2两个版本。 |
数据采集 | 控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
待监控服务类型 | 待监控的服务类型,包括:全部、投资交易、登记过户、直销 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
summaryMsg | TUX服务概况 | sumReqTreated | 处理请求总数 |
sumReqInQueue | 队列中请求总数 | ||
sumReqRatio | 请求负载 | ||
sumActiveSrv | 已启动服务数 | ||
sumAbnormalTsrvr | 异常服务数 | ||
serversSum | 服务信息 | tuxTsrvrName | 服务名 |
tuxTotActiveSrvC | 启动 | ||
tuxTotIdleSrvC | 空闲 | ||
tuxTsrvrCurService | 当前运行 | ||
tuxTsrvrTotReqC | 已处理请求 | ||
tuxTqueueNqueued | 队列请求 | ||
tuxTqueueSrvrCnt | 队列关联服务 | ||
tuxTsrvrOutOfBusy | 服务空闲 | ||
tuxTotSrvSmallMin | 服务数过少 | ||
tuxTsrvrQueueCnt | 关联队列数 | ||
serversMsg | 服务详细信息 | tuxTsrvrName | 服务名 |
tuxTsrvrId | 服务编号 | ||
tuxTsrvrState | 服务状态 | ||
tuxTsrvrCurService | 当前运行 | ||
tuxTsrvrTotReqC | 已处理请求 | ||
tuxTsrvrCurReq | 当前请求 | ||
tuxTsrvrNumTran | 已处理事务 | ||
tuxTsrvrTranCmt | 已提交事务 | ||
queueMsg | 队列信息 | tuxTsrvrName | 关联服务名 |
tuxTqueueRqAddr | 队列符号地址 | ||
tuxTqueueState | 队列状态 | ||
tuxTqueueTotNqueued | 队列处理总数 | ||
tuxTqueueNqueued | 队列当前处理数 | ||
tuxTqueueTotWkQueued | 队列处理请求总数 | ||
tuxTqueueWkQueued | 队列当前请求数 | ||
tuxTqueueSrvrCnt | 队列关联服务数 |
11.16.5 Jres
监视目的:
通过T2协议方式监控JRES服务器的使用和健康状况。
监视器前提:
被监控端需加载相关插件:CEP(通用事件处理平台)插件,T2插件,本地通道插件
使用说明:
启用SSL设置:需在JRES服务端配置相应的服务端证书,并修改ares-app-config.xml的t2通道插件配置,将安全级别调至SSL级
并将客户端证书、根证书置于监控平台server/secret目录下
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
SSL | 是否启用SSL加密方式。 |
客户端证书名 | 客户端证书的名称,启用SSL时显示。 |
客户端证书口令 | 客户端证书的密码,启用SSL时显示。 |
根证书名 | 根证书的名称,启用SSL时显示。 |
根证书口令 | 根证书的密码,启用SSL时显示。 |
IP集群地址 | IP集群地址设置,各参数含义如下:IP地址:接入该区域的设备的IP地址。T2端口:连接开放端口。连接池大小:连接池的连接数。 |
证书名 | T2证书名。 |
监视数据 | 监视数据项包括:本地通道运行时参数,CEP插件服务执行情况,CEP插件服务处理插件线程池,CEP插件分发线程池,T2插件分发线程池,路由表远程节点连接信息 |
数据采集 | 控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
jres.localService#s#queryRuntimeParameters | 本地通道运行时参数 | procEventCountByPollingtime | 发送事件个数 |
procEventCount | 发送事件总个数 | ||
waitingEventCountByPollingtime | 未响应事件个数 | ||
waitingEventCount | 未响应事件总数 | ||
timeoutCountByPollingtime | 超时事件个数 | ||
timeoutCount | 超时事件总数 | ||
abandonedCountByPollingtime | 丢弃事件个数 | ||
abandonedCount | 丢弃事件总数 | ||
defaultTimeout | 同步调用超时时间 | ||
counterFlag | 启用功能计数 | ||
jres.cepcore#s#queryProcServices | CEP插件服务执行情况 | serviceId | 服务名 |
executeTimes | 执行次数 | ||
executeFailureTimes | 执行失败次数 | ||
excuteTime | 总执行时间 | ||
excuteAvgTime | 执行平均时间 | ||
excuteMinTime | 执行最短时间 | ||
excuteMaxTime | 执行最长时间 | ||
lastUpdateTime | 最后注册时间 | ||
aliasId | 服务别名 | ||
desc | 服务描述 | ||
jres.cepcore#s#queryBizServiceInfo | CEP插件服务处理插件线程池 | threadNo | 线程编号 |
queueSize | 队列长度 | ||
queueCapability | 队列容量 | ||
procEventCount | 执行事件次数 | ||
procErrorCount | 执行事件失败次数 | ||
rejectCount | 拒绝处理事件个数 | ||
status | 状态 | ||
processingService | 处理中的事件服务名 | ||
processingStep | 正在处理服务步骤 | ||
firstQueueFullTime | 第一次队列满的时间 | ||
jres.cepcore#s#queryDispatchPoolInfo | CEP插件分发线程池 | threadNo | 线程编号 |
queueSize | 队列长度 | ||
queueCapability | 队列容量 | ||
rejectCount | 拒绝处理事件个数 | ||
status | 状态 | ||
procEventCount | 处理事件的个数 | ||
routeErrorCount | 路由失败个数 | ||
procErrorCount | 处理失败事件个数 | ||
processingService | 正在处理的事件服务名 | ||
firstQueueFullTime | 第一次队列满的时间 | ||
processingStep | 正在处理服务步骤 | ||
jres.t2channel#s#querySenderPoolInfo | T2插件分发线程池 | threadNo | 线程编号 |
queueSize | 队列长度 | ||
queueCapability | 队列容量 | ||
rejectCount | 拒绝处理事件个数 | ||
status | 线程状态 | ||
procEventCount | 处理事件的个数 | ||
procErrorCount | 处理失败事件个数 | ||
firstQueueFullTime | 第一次队列满的时间 | ||
jres.cepcore#s#queryRouteTableNodeInfo | 路由表远程节点连接信息 | aliases | 功能号 |
branchNo | 分支号 | ||
systemNo | 系统号 | ||
subSystemNo | 子系统号 | ||
isTruncation | 是否路由截断 | ||
nodeName | 远程节点名 | ||
remoteNodeNo | 远程节点编号 | ||
address | 远程节点IP | ||
port | 远程节点端口 | ||
status | 状态 | ||
connectedCount | 远程连接节点数 |
11.16.6 Nginx
监控目的:
监视nginx服务器的运行状况和资源使用状况。
监视数据:
包括响应时间、nginx连接数、nginx keepalive状态数等信息。
输入参数
字段 | 含义 |
---|---|
监视器名字 | 监视器的名称。 |
轮询时间 | 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。 |
监视器是否运行 | 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。 |
主机地址 | Nginx服务器主机地址 |
端口 | Nginx服务器连接端口 |
数据采集 | 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。 |
执行计划 | 用于设置监视器监视任务的执行时间。 |
输出参数
指标项 | 指标项描述 | 指标名 | 指标名描述 |
---|---|---|---|
nginxStatus | 性能数据 | waiting | waiting数(keepalived) |
hostName | 主机名 | ||
activeConn | 连接数(个) | ||
responseTime | 响应时间(ms) | ||
accepts | 已接受 | ||
handled | 已处理 | ||
requests | 全部请求数 | ||
dropped | 已丢弃 |